首页> 外文OA文献 >On the Direction of Discrimination: An Information-Theoretic Analysis of Disparate Impact in Machine Learning
【2h】

On the Direction of Discrimination: An Information-Theoretic Analysis of Disparate Impact in Machine Learning

机译:论歧视方向:信息理论分析   机器学习中的不同影响

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

In the context of machine learning, disparate impact refers to a form ofsystematic discrimination whereby the output distribution of a model depends onthe value of a sensitive attribute (e.g., race or gender). In this paper, wepresent an information-theoretic framework to analyze the disparate impact of abinary classification model. We view the model as a fixed channel, and quantifydisparate impact as the divergence in output distributions over two groups. Wethen aim to find a \textit{correction function} that can be used to perturb theinput distributions of each group in order to align their output distributions.We present an optimization problem that can be solved to obtain a correctionfunction that will make the output distributions statisticallyindistinguishable. We derive closed-form expression for the correction functionthat can be used to compute it efficiently. We illustrate the use of thecorrection function for a recidivism prediction application derived from theProPublica COMPAS dataset.
机译:在机器学习的上下文中,不同的影响是指系统歧视的一种形式,其中模型的输出分布取决于敏感属性(例如种族或性别)的值。在本文中,我们提出了一个信息理论框架来分析二进制分类模型的不同影响。我们将模型视为固定渠道,并将不同的影响量化为两组输出分布的差异。然后,我们的目标是找到一个\ textit {correction function},可以用来扰动每个组的输入分布以对齐它们的输出分布。我们提出了一个优化问题,可以解决该问题,以获得一个校正函数,该函数将使输出分布在统计上无法区分。我们导出校正函数的闭合形式的表达式,该表达式可用于有效地计算它。我们说明了校正函数在从ProPublica COMPAS数据集派生的累犯预测应用程序中的使用。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号